Qu'est ce que le Machine Learning
L'apprentissage automatique (en anglais Machine Learning) est une branche de l'informatique, (l'intelligence artificielle) qui confère aux ordinateurs la capacité (d’apprendre) de generer des applications (modèles) à partir des données sans être explicitement programmés.
Qu'est ce que la Machine Learning
Le but de machine learning est d'essayer de resoudre une tache pratique (exemple reconnaitre une voiture) . Il consiste en la mise en place d’algorithmes ayant pour objectif d’obtenir un algorithme à partir d'analyse predictive et statistique des données d'apprentissage. Ce modele va par la suite etre evalué et amelioré avec d'autres données que le modele n'a jamais vu, avant d'etre implementé en production une fois que le taux de reussite est jugé satisfaisant.

Machine Learning vs data mining
retraiter les données déjà connues pour en sortir des propriétés et des précisions encore inconnues. (Pattern)
apprendre aux systèmes à prédire ce que pourrait être le résultat des données nouvelles à partir de données connues. (Application)
Machine Learning vs big data

6 / 34
Machine Learning Vs IA
8 / 34
Cycle de projet Machine Learning
Cycle de projet Machine Learning
les differents types d'apprentissage automatique
● L’apprentissage supervisé (Supervised Learning)
● L’apprentissage non supervisé (Unsupervised Learning)
● L’apprentissage par renforcement (Reinforcement Learning)
● L’apprentissage par transfert
Apprentissage supervisé
Apprentissage non supervisé
Apprentissage par renforcement (Reinforcement Learning)
Méthode consiste à laisser l’algorithme apprendre de ses propres erreurs. Afin d’apprendre à prendre les bonnes décisions, l’intelligence artificielle se retrouve directement confrontée à des choix. Si elle se trompe, elle est ” pénalisée “. Au contraire, si elle prend la bonne décision, elle est ” récompensée “. Afin d’obtenir toujours plus de récompenses, l’IA va donc faire de son mieux pour optimiser sa prise de décisions.
Regression
C'est une méthode statistique qui permet d'analyser et comprendre la relation entre deux ou plusieurs variables d'intérêt. Le processus aide à comprendre quels variables sont les plus influents, et lequelles pourraient etre ignorés, en estimant les interactions entre les differents facteurs analysés.
Regression lineaire
La régression linéaire est un modèle de régression qui cherche à établir une relation linéaire entre une variable, dite expliquée, et une ou plusieurs variables, dites explicatives.
La regression logistique
La régression logistique est une technique de classification utilisée pour les problèmes de classification binaire tels que la classification des tumeurs comme malignes / non malignes, la classification des e-mails comme spam / non spam.
il est classé dans les algorithme de classification
La régression logistique ou modèle logit est un modèle de régression binomiale. Comme pour tous les modèles de régression binomiale, il s'agit de modéliser au mieux un modèle mathématique simple à des observations réelles nombreuses. En d'autres termes d'associer à un vecteur de variables aléatoires (x1,..xk) une variable aléatoire binomiale génériquement notée y
Elle s'utilise lorsque la variable à expliquer (variable dépendante Y) est qualitative, le plus souvent binaire. Les variables explicatives (variables indépendantes Xi) peuvent être par contre soit qualitatives, soit quantitatives. La variable dépendante est habituellement la survenue ou non d'un événement (maladie ou autre) et les variables indépendantes sont celles susceptibles d'influencer la survenue de cet événement c'est-à-dire les variables mesurant l'exposition à un facteur de risque ou à un facteur protecteur, ou variable représentant un facteur de confusion.
Regression polynomiale
Ce type de technique de régression est utilisé pour modéliser des équations non linéaires en prenant des fonctions polynomiales de variables indépendantes.
Presentation Python
Python (/ˈpaɪ.θɑn/5) est un langage de programmation interprété, multi-paradigme et multiplateformes. Il favorise la programmation impérative structurée, fonctionnelle et orientée objet. Il est doté d'un typage dynamique fort, d'une gestion automatique de la mémoire par ramasse-miettes et d'un système de gestion d'exceptions ; il est ainsi similaire à Perl, Ruby, Scheme, Smalltalk et Tcl.
Le langage Python est placé sous une licence libre proche de la licence BSD6 et fonctionne sur la plupart des plates-formes informatiques, des smartphones aux ordinateurs centraux7, de Windows à Unix avec notamment GNU/Linux en passant par macOS, ou encore Android, iOS, et peut aussi être traduit en Java ou .NET. Il est conçu pour optimiser la productivité des programmeurs en offrant des outils de haut niveau et une syntaxe simple à utiliser.
Presentation Pandas
Pandas est une librairie python qui permet de manipuler facilement des données à analyser :
manipuler des tableaux de données avec des étiquettes de variables (colonnes) et d'individus (lignes).
ces tableaux sont appelés DataFrames, similaires aux dataframes sous R.
on peut facilement lire et écrire ces dataframes à partir ou vers un fichier tabulé.
Presentation Sklearn
Scikit-learn est une bibliothèque libre Python destinée à l'apprentissage automatique. Elle est développée par de nombreux contributeurs2 notamment dans le monde académique par des instituts français d'enseignement supérieur et de recherche comme Inria3.
Elle propose dans son framework de nombreuses bibliothèques d’algorithmes à implémenter clé en main, à disposition des data scientists.
TP Regression avec Boston Maison
Presentation ORANGE
Orange est un logiciel libre d'exploration de données (data mining). Il propose des fonctionnalités de modélisation à travers une interface visuelle, une grande variété de modalités de visualisation et des affichages variés dynamiques2
Tree : Decision Tree
Classification : KNN , SVM
Clustering : KMeans
Dimension reduction : PCA